import pandas as pd
import re

df = pd.read_csv("HousePrice_ty.csv")
df = df.dropna()

# 定义函数来提取数字部分
def extract_number(text):
    match = re.search(r'\d+', text)
    if match:
        return int(match.group())  # 返回整数形式的数字部分
    else:
        return None  # 如果没有找到匹配的数字部分，则返回 None 或者其他适当的值

df['PRICE'] = df['PRICE'].apply(extract_number)
df['DATE'] = df['DATE'].str.replace(r'房价', '').str.replace(r'年', '-').str.replace(r'月', '')

# 将日期信息转换为 datetime 类型（如果尚未是 datetime 类型的话）
df['DATE'] = pd.to_datetime(df['DATE'], format='%Y-%m')
# 按日期信息排序
df = df.sort_values(by='DATE').reset_index(drop=True)
df = df.drop(df.index[-1])

#print(df)
csv_data = df.to_csv("HousePrice_tyHanding.csv",index=None)

